3-7 對立的雞群們
在飛哥的工作室也待好一陣子的小博,這天在網路上收集資料,以便幫飛哥在報告上有更完備的附錄說明。明天兩人就要從台北前往台灣的地理中心,也就是南投,去探訪一間擁有30年烏骨雞養殖經驗的農場。農場主人是由一位叫茉香的女主人所打理的,雖然農場在山上,但也請了不少工人每天協助煮雞飼料、採集雞蛋、種菜等工作,因此在山區雖不方便,卻能自給自足。
「小博,你知道茉姨養的雞跟一般的雞哪裡不一樣嗎?」飛哥饒富興致的詢問著。
「嗯...是骨頭都是黑的嗎?還是都是放山雞?」小博把可能的答案都講了一遍。
飛哥笑了笑說:「烏骨雞的骨頭當然是黑的啦,哈哈,是說茉姨養的雞確實是採半放養的方式,所以雞肉會比平常吃的還要再有彈性一些。不過重要的是,她養的雞啊!就跟黑社會一樣,會分派系喔!」
「分派系?是說雞隻會一群一群的盤踞在各個山頭或村莊嗎?」小博睜大眼睛問著。
「齁齁,她們家的地沒這麼大啦,不過確實每個派系的烏骨雞會佔領不同的地方,像是有草地派的啦,倉庫派的啦,林地派的啦,好像有四五群吧,每群的正中間會站著牠們的首領。我把雞隻的分布圖給你看有想到甚麼嗎?」飛哥說完拿出一張茉姨繪製的農場地圖。
小博思索了下:「嗯?這邊有一群,那邊好像有兩三群,這好像跟之前講的KNN不太一樣啊,如果說有標記哪一隻雞是哪一群或是首領在哪就好了。」
「你講到重點啦!光看這張圖我們無法分辨有幾個首領,也無法確定雞有幾群。像這種沒標記的資料可以用 k-means algorithm 來分析,這是種非監督式的機器學習方法,可以藉由定出有幾個群,再來找出各群的中心點喔!」飛哥回想起前幾天在博覽會的事情。
「所以說這個群的數量要怎麼設定啊?」小博問了個問題。